Hệ số tương quan là gì? Các công bố khoa học về Hệ số tương quan
Hệ số tương quan là một phép đo độ mạnh và hướng của mối quan hệ tương quan giữa hai biến số. Nó được biểu diễn bằng một con số nằm trong khoảng -1 đến 1. Một h...
Hệ số tương quan là một phép đo độ mạnh và hướng của mối quan hệ tương quan giữa hai biến số. Nó được biểu diễn bằng một con số nằm trong khoảng -1 đến 1. Một hệ số tương quan gần bằng 1 cho thấy một tương quan mạnh và tích cực, trong khi một hệ số tương quan gần bằng -1 cho thấy một tương quan mạnh và có hướng âm. Một hệ số tương quan gần bằng 0 cho thấy một tương quan yếu hoặc không có tương quan giữa hai biến số.
Hệ số tương quan (hay còn gọi là hệ số tương quan Pearson) đo lường mối quan hệ tương quan tuyến tính giữa hai biến số. Nó cho biết độ mạnh và hướng của tương quan giữa hai biến.
Hệ số tương quan Pearson được tính bằng công thức:
r = (Σ[(x_i - x̄)(y_i - ȳ)]) / [√(Σ(x_i - x̄)²) √(Σ(y_i - ȳ)²)]
Trong đó:
- r là hệ số tương quan Pearson.
- x_i và y_i lần lượt là các giá trị của hai biến số.
- x̄ và ȳ lần lượt là trung bình của hai biến số.
- Σ là ký hiệu tổng của tất cả các phần tử trong dãy.
- √ là ký hiệu căn bậc hai.
Hệ số tương quan Pearson có giá trị nằm trong khoảng -1 đến 1. Các giá trị có ý nghĩa như sau:
- Nếu r = 1 hoặc r = -1, tức là tương quan hoàn hảo và có hướng. Nếu r = 1 thì tương quan là tuyến tính và tích cực, còn nếu r = -1 thì tương quan tuyến tính và có hướng âm. Điều này có nghĩa là khi một biến tăng, biến còn lại cũng sẽ tăng hoặc giảm theo cùng một tỷ lệ.
- Nếu r = 0, tức là không có tương quan tuyến tính giữa hai biến số. Điều này không có nghĩa là không có quan hệ giữa chúng, mà chỉ không có quan hệ tuyến tính.
- Giá trị r nằm trong khoảng từ 0 đến 1 hoặc từ -1 đến 0 cho biết mức độ mạnh yếu của tương quan tuyến tính giữa hai biến số. Nếu r càng gần 0, tương quan càng yếu, còn nếu r càng gần -1 hoặc 1, tương quan càng mạnh.
Hệ số tương quan Pearson chỉ đo lường mối quan hệ tuyến tính giữa hai biến số. Nếu mối quan hệ giữa chúng không phải là tuyến tính, thì hệ số tương quan Pearson không thể phản ánh chính xác mối quan hệ đó.
Hệ số tương quan Pearson là một phép đo độ tương quan tuyến tính giữa hai biến số trong một tập dữ liệu. Nó đặc trưng cho mức độ tương quan và hướng tương quan giữa hai biến số.
Hệ số tương quan Pearson được tính bằng cách đo lường độ biến thiên của hai biến số x và y từ trung bình đến mỗi điểm dữ liệu và tính toán tỉ lệ giữa hai độ biến thiên này. Công thức tính hệ số tương quan Pearson được cho bởi:
r = (Σ[(x_i - x̄)(y_i - ȳ)]) / [√(Σ(x_i - x̄)²) √(Σ(y_i - ȳ)²)]
Trong đó:
- r là hệ số tương quan Pearson.
- x_i và y_i là các giá trị trong hai biến số x và y.
- x̄ và ȳ là giá trị trung bình của biến số x và y.
- Σ là ký hiệu tổng của tất cả các phần tử trong dãy.
- √ là ký hiệu căn bậc hai.
Hệ số tương quan Pearson có giá trị nằm trong khoảng từ -1 đến 1. Các giá trị cụ thể có ý nghĩa như sau:
- Khi hệ số tương quan r = 1, tức là có một tương quan tuyến tính hoàn hảo và tích cực giữa hai biến số. Điều này có nghĩa là khi một biến tăng, biến còn lại cũng tăng theo cùng một tỷ lệ.
- Khi hệ số tương quan r = -1, tức là có một tương quan tuyến tính hoàn hảo và có hướng âm giữa hai biến số. Điều này có nghĩa là khi một biến tăng, biến còn lại giảm theo cùng một tỷ lệ.
- Khi hệ số tương quan r = 0, tức là không có tương quan tuyến tính giữa hai biến số. Điều này không có nghĩa là không có mối quan hệ giữa hai biến số, mà chỉ không có mối quan hệ tuyến tính.
- Giá trị r nằm trong khoảng từ -1 đến 1 đo lường độ mạnh của tương quan tuyến tính giữa hai biến số. Nếu giá trị r gần 0, tương quan yếu, còn nếu giá trị r gần -1 hoặc 1, tương quan mạnh hơn.
Hệ số tương quan Pearson không chỉ đo lường mức độ tương quan tuyến tính giữa hai biến số, mà còn cho phép xác định hướng tương quan. Nếu giá trị dương (+) thì tương quan là tích cực (tăng giảm cùng nhau), trong khi nếu giá trị âm (-) thì tương quan là tiêu cực (tăng giảm ngược nhau).
Danh sách công bố khoa học về chủ đề "hệ số tương quan":
Một phương pháp ước tính hàm lượng cholesterol trong phần lipoprotein có tỷ trọng thấp của huyết thanh (Sf0-20) được trình bày. Phương pháp này bao gồm các phép đo nồng độ cholesterol toàn phần trong huyết tương khi đói, triglyceride và cholesterol lipoprotein có tỷ trọng cao, không yêu cầu sử dụng thiết bị siêu ly tâm chuẩn bị. So sánh quy trình được đề xuất này với quy trình trực tiếp hơn, trong đó thiết bị siêu ly tâm được sử dụng, đã cho thấy các hệ số tương quan từ 0,94 đến 0,99, tùy thuộc vào nhóm bệnh nhân được so sánh.
Trong quá khứ, các bộ cơ sở dùng cho các tính toán phân tử có tương quan chủ yếu được lấy từ các tính toán cấu hình đơn. Gần đây, Almlöf, Taylor, và các đồng nghiệp đã phát hiện rằng các bộ cơ sở của các quỹ đạo tự nhiên thu được từ các tính toán có tương quan nguyên tử (với tên gọi ANOs) cung cấp một mô tả tuyệt vời về các hiệu ứng tương quan phân tử. Báo cáo này là kết quả từ một nghiên cứu cẩn thận về các hiệu ứng tương quan trong nguyên tử oxygen, khẳng định rằng các bộ cơ sở Gaussian nguyên thủy gọn nhẹ có khả năng và hiệu quả trong mô tả các hiệu ứng tương quan nếu các số mũ của các hàm được tối ưu hóa trong các tính toán nguyên tử có tương quan, mặc dù các hàm nguyên thủy (sp) dùng để mô tả các hiệu ứng tương quan có thể được lấy từ các tính toán Hartree–Fock nguyên tử nếu bộ cơ sở nguyên thủy thích hợp được sử dụng. Các tính toán thử nghiệm trên các phân tử chứa oxygen cho thấy các bộ cơ sở nguyên thủy này mô tả các hiệu ứng tương quan phân tử tốt như các bộ ANO của Almlöf và Taylor. Dựa trên các tính toán trên oxygen, các bộ cơ sở cho các tính toán nguyên tử và phân tử có tương quan được phát triển cho tất cả các nguyên tố trong hàng đầu tiên từ boron đến neon và cho hydro. Cũng như trong các tính toán trên nguyên tử oxygen, đã nhận thấy rằng gia tăng năng lượng do cộng thêm các hàm mang tính tương quan rơi vào các nhóm cụ thể. Điều này dẫn đến khái niệm về các bộ cơ sở tương quan nhất quán, tức là, các bộ bao gồm tất cả các hàm trong một nhóm cụ thể cũng như tất cả các hàm trong các nhóm cao hơn. Các bộ cơ sở tương quan nhất quán đã được đưa ra cho tất cả các nguyên tử được xem xét. Những bộ cơ sở chính xác nhất được xác định theo cách này, [5s4p3d2f1g], liên tục mang lại 99% năng lượng tương quan đạt được với các bộ ANO tương ứng, mặc dù bộ cơ sở sau chứa nhiều hơn 50% các hàm nguyên thủy và gấp đôi số hàm phân cực nguyên thủy. Ước tính rằng bộ này mang lại 94%–97% tổng năng lượng tương quan (HF+1+2) cho các nguyên tử từ neon đến boron.
Một tập hợp cơ sở Gaussian loại thu gọn (6-311G**) đã được phát triển bằng cách tối ưu hóa các số mũ và hệ số ở cấp độ bậc hai của lý thuyết Mo/ller–Plesset (MP) cho trạng thái cơ bản của các nguyên tố hàng đầu tiên. Tập hợp này có sự tách ba trong các vỏ valence s và p cùng với một bộ các hàm phân cực chưa thu gọn đơn lẻ trên mỗi nguyên tố. Tập cơ sở được kiểm tra bằng cách tính toán cấu trúc và năng lượng cho một số phân tử đơn giản ở các cấp độ lý thuyết MP khác nhau và so sánh với thực nghiệm.
Để đánh giá các phân loại nhị phân và ma trận nhầm lẫn của chúng, các nhà nghiên cứu khoa học có thể sử dụng một số tỷ lệ thống kê, tùy theo mục tiêu của cuộc thí nghiệm mà họ đang điều tra. Mặc dù đây là một vấn đề quan trọng trong học máy, nhưng chưa có sự đồng thuận rộng rãi về một chỉ số lựa chọn thống nhất nào. Độ chính xác và điểm F1 được tính toán trên các ma trận nhầm lẫn đã (và vẫn đang) là một trong những chỉ số phổ biến nhất được áp dụng trong các nhiệm vụ phân loại nhị phân. Tuy nhiên, những đo lường thống kê này có thể một cách nguy hiểm cho thấy kết quả phồng lên quá lạc quan, đặc biệt là trên các tập dữ liệu không cân bằng.
Thay vào đó, hệ số tương quan Matthews (MCC) là một tỷ lệ thống kê đáng tin cậy hơn, chỉ sản xuất điểm số cao nếu dự đoán đạt kết quả tốt trong tất cả bốn loại trong ma trận nhầm lẫn (các dương đúng, các âm sai, các âm đúng và các dương sai), theo tỷ lệ cả về kích thước của các yếu tố dương và kích thước của các yếu tố âm trong tập dữ liệu.
Trong bài viết này, chúng tôi chỉ ra cách mà MCC sản xuất một điểm số thông tin và trung thực hơn trong việc đánh giá phân loại nhị phân so với độ chính xác và điểm F1, bằng cách trước tiên giải thích các tính chất toán học, và sau đó là lợi ích của MCC trong sáu trường hợp sử dụng tổng hợp và trong một kịch bản thực tế về gen. Chúng tôi tin rằng hệ số tương quan Matthews nên được ưu tiên hơn độ chính xác và điểm F1 trong việc đánh giá các nhiệm vụ phân loại nhị phân bởi tất cả các cộng đồng khoa học.
Các thay đổi nội soi của thực quản có giá trị chẩn đoán và xác định những bệnh nhân có nguy cơ mắc bệnh mãn tính. Tuy nhiên, hiện có sự thiếu đồng thuận nghiêm trọng về cách mô tả và phân loại hình ảnh của viêm thực quản do trào ngược.
Để kiểm tra độ tin cậy của các tiêu chí mô tả mức độ xung quanh của các điểm tổn thương niêm mạc và đánh giá các tương quan lâm sàng và chức năng của bệnh nhân mắc bệnh trào ngược thực quản mà mức độ viêm thực quản được phân loại theo hệ thống Los Angeles.
Bốn mươi sáu chuyên gia nội soi từ các quốc gia khác nhau đã sử dụng một bảng kiểm tra chi tiết để đánh giá các video nội soi từ 22 bệnh nhân với đầy đủ mức độ nghiêm trọng của viêm thực quản do trào ngược. Trong các nghiên cứu riêng biệt, các phân loại hệ thống Los Angeles đã được tương quan với việc theo dõi pH thực quản trong 24 giờ (178 bệnh nhân), và với các thử nghiệm lâm sàng về điều trị omeprazole (277 bệnh nhân).
Đánh giá mức độ xung quanh của viêm thực quản theo tiêu chí xem các điểm tổn thương niêm mạc kéo dài giữa các đỉnh của các nếp gấp niêm mạc, cho thấy sự đồng thuận chấp nhận được (giá trị κ trung bình 0.4) giữa các quan sát viên. Cách tiếp cận này được sử dụng trong hệ thống Los Angeles. Một phương pháp thay thế là nhóm mức độ xung quanh của các điểm tổn thương niêm mạc chiếm 0–25%, 26–50%, 51–75%, 76–99% hoặc 100% chu vi thực quản, cho thấy sự biến động giữa các quan sát viên ở mức không chấp nhận được (giá trị κ trung bình 0–0.15) đối với tất cả nhưng thể loại mức độ thấp nhất (giá trị κ trung bình 0.4). Mức độ tiếp xúc với axit thực quản có liên quan đáng kể (p<0.001) đến mức độ nghiêm trọng của viêm thực quản. Các mức độ viêm thực quản trước điều trị A–C có liên quan đến mức độ nghiêm trọng của chứng ợ nóng (p<0.01), kết quả điều trị omeprazole (10 mg mỗi ngày) (p<0.01), và nguy cơ tái phát triệu chứng khi ngừng điều trị trong vòng sáu tháng (p<0.05).
Kết quả cung cấp thêm hỗ trợ cho các nghiên cứu trước đây về tính hữu dụng lâm sàng của hệ thống Los Angeles trong việc phân loại viêm thực quản nội soi.
Mục tiêu của nghiên cứu này là xác định mối quan hệ giữa mức độ β-hydroxybutyrate và kiểm soát cơn động kinh ở trẻ em áp dụng chế độ ăn ketogenic. Bảy mươi bốn trẻ em đang thực hiện chế độ ăn ketogenic đến thăm khám định kỳ đã có mức β-hydroxybutyrate trong máu tương quan với sự kiểm soát cơn động kinh của họ. Bốn mươi hai trẻ em nhập viện để bắt đầu chế độ ăn ketogenic đã được đo ketone trong nước tiểu bằng que thử và tương quan với mức β-hydroxybutyrate trong máu tại thời điểm đó. Mức β-hydroxybutyrate trong máu có tương quan thống kê với sự kiểm soát cơn động kinh (P = .003). Trẻ em có mức β-hydroxybutyrate trong máu lớn hơn 4 mmol/L có khả năng giảm tần suất cơn động kinh cao hơn đáng kể so với những trẻ có mức dưới 4 mmol/L. Ketone trong nước tiểu 4+ (160 mmol/L) được phát hiện trên que thử khi mức β-hydroxybutyrate trong máu vượt quá 2 mmol/L. Việc kiểm soát cơn động kinh có tương quan với mức β-hydroxybutyrate trong máu và có khả năng xảy ra cao hơn khi mức này lớn hơn 4 mmol/L. Việc đo ketone trong nước tiểu bằng que thử truyền thống ở trẻ em thực hiện chế độ ăn ketogenic cung cấp một đánh giá kém về mức độ xeton huyết. Ba đến bốn cộng (80-160 mmol/L) ketone trong nước tiểu là cần thiết, nhưng không nhất thiết đủ, để đạt được kiểm soát cơn động kinh tối ưu ở trẻ em trên chế độ ăn ketogenic. Tuy nhiên, hiện tại, ketone trong nước tiểu là phương pháp duy nhất dễ dàng và chi phí thấp để đánh giá mức độ xeton.
Ung thư là một bệnh lý đa dạng với nhiều biến thể di truyền. Các dòng chứng cứ đã chỉ ra rằng sự biến đổi số lượng bản sao (CNVs) của một số gen tham gia vào việc phát triển và tiến triển của nhiều loại ung thư thông qua sự thay đổi mức độ biểu hiện gen của từng loại ung thư hoặc nhiều loại ung thư khác nhau. Tuy nhiên, nó vẫn chưa rõ liệu mối tương quan này có phải là một hiện tượng chung giữa nhiều loại ung thư hay không.
Trong nghiên cứu này, chúng tôi đã áp dụng một phương pháp sinh tin học tích hợp CNV và biểu hiện gen khác biệt một cách toán học trên 1025 dòng tế bào và 9159 mẫu bệnh nhân để phát hiện mối quan hệ tiềm năng của chúng.
Kết quả của chúng tôi cho thấy có một mối tương quan chặt chẽ giữa CNV và biểu hiện gen khác biệt và số lượng bản sao thể hiện một ảnh hưởng tuyến tính tích cực lên biểu hiện gen cho phần lớn các gen, cho thấy rằng sự biến đổi di truyền tạo ra một hiệu ứng trực tiếp lên mức độ phiên mã gen. Một tập dữ liệu độc lập khác được sử dụng để xác nhận lại mối quan hệ giữa số lượng bản sao và mức độ biểu hiện. Phân tích thêm cho thấy các gen có ảnh hưởng tuyến tính tích cực chung lên biểu hiện gen được nhóm trong những con đường liên quan đến bệnh tật nhất định, điều này gợi ý sự tham gia của CNV vào bệnh sinh của các bệnh lý.
- 1
- 2
- 3
- 4
- 5
- 6
- 10